Comparación de clasificadores para el reconocimiento de notas musicales

نویسندگان

  • Omar Velázquez López
  • José Luis Oropeza Rodríguez
  • Sergio Suárez Guerra
چکیده

Este artículo describe el conjunto de experimentos realizados para obtener el reconocimiento de 60 notas musicales de un piano digital por medio de técnicas de procesamiento digital de señales y clasificadores. Para la etapa de técnicas de procesamiento digital de señales se utilizaron: Frecuencia fundamental, coeficientes Cepstrales en la Frecuencia de Mel y Cepstrales de Mecánica Coclear. Para los clasificadores se consideraron Modelos Ocultos de Markov usando HTK (Hidden Markov Model Toolkit), Modelos de Mixturas Gaussianas, Redes Neuronales Artificiales y Cuantificación Vectorial. El corpus creado para este trabajo consistió de 720 notas comprendidas en un rango de cinco octavas. Se usaron 12 archivos para cada una de las 60 notas a reconocer, las cuales se grabaron a una velocidad 70 bpm (beats per minute). Los mejores resultados se obtuvieron al aplicar coeficientes CMCC como técnica y Modelos Ocultos de Markov como clasificador (100% de reconocimiento en cada octava). Igualmente se obtuvo el 100% de reconocimiento por octava al usarse coeficientes MFCC como técnica y Cuantificación Vectorial como clasificador. Palabras clave: Transcripción automática de música, procesamiento digital de señales, reconocimiento de patrones. Comparison of Classifiers for Recognition of Musical Notes Abstract. This paper describes the set of experiments performed for recognition of 60 musical notes of a digital piano using digital signal processing techniques and classifiers. In the stage of digital signal processing techniques we used: Fundamental frequency (Pitch), Mel-Frequency Cepstral Coefficients (MFCC) and Cochlear Mechanics Cepstral Coefficients (CMCC). The implemented classifiers were: Hidden Markov Models (HMM) using HTK (Hidden Markov Model Toolkit), Gaussian Mixture Models (GMM), Neuronal Networks and Vector Quantization (VQ). The created corpus for this work consists of 720 notes included in a range of five octaves. We used 12 files for each one of the 60 notes for recognition, which were recorded in a speed of 70 beats per minute. The best results were obtained applying CMCC as technic and HMM as classifier (100% This paper describes the set of experiments performed for recognition of 60 musical notes of a digital piano using digital signal processing techniques and classifiers. In the stage of digital signal processing techniques we used: Fundamental frequency (Pitch), Mel-Frequency Cepstral Coefficients (MFCC) and Cochlear Mechanics Cepstral Coefficients (CMCC). The implemented classifiers were: Hidden Markov Models (HMM) using HTK (Hidden Markov Model Toolkit), Gaussian Mixture Models (GMM), Neuronal Networks and Vector Quantization (VQ). The created corpus for this work consists of 720 notes included in a range of five octaves. We used 12 files for each one of the 60 notes for recognition, which were recorded in a speed of 70 beats per minute. The best results were obtained applying CMCC as technic and HMM as classifier (100%

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Clasificadores supervisados para el análisis predictivo de muerte y sobrevida materna

El presente trabajo se basa en el análisis de los clasificadores supervisados que puedan generar resultados aceptables para la predicción de la muerte y sobrevida materna, según características de pacientes complicadas durante su gestación determinada por los expertos salubristas. Se describe la metodología del desarrollo, las particularidades de la muestra, además los instrumentos utilizados p...

متن کامل

Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos

Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...

متن کامل

Transcripción de música polifónica para piano basada en la resolución de grupos de notas y estados finitos

Resumen En ésta Tesis se desarrolla un modelo para la transcripción musical polifónica mediante una aproximación de estados finitos y la aplicación de reglas de decisión basadas en heurísticas para la resolución de grupos de notas. El sistema de transcripción desarrollado se implementa mediante un diagrama de estados finitos que representan grupos de notas, es decir, conjunto de notas que suena...

متن کامل

Integración de optimización evolutiva para el reconocimiento de emociones en voz

Resumen. En este art́ıculo se presenta el desarrollo de un sistema de reconocimiento de emociones basado en la voz. Se consideraron las siguientes emociones básicas: Enojo, Felicidad, Neutro y Tristeza. Para este propósito una base de datos de voz emocional fue creada con ocho usuarios Mexicanos con 640 frases (8 usuarios × 4 emociones × 20 frases por emoción). Los Modelos Ocultos de Markov (Hid...

متن کامل

Reconstrucción de caracteres para mejora de sistemas OCR con RNA's

Resumen. Numerosos avances dentro de la Inteligencia Artificial han estado inspirados en las caracteŕısticas de los procesos biológicos de las redes neuronales. Estas caracteŕısticas, por las ventajas que presentan, han intentado ser emuladas dentro de una computadora para imitar las tareas que son capaces de realizar los seres humanos. Siendo el OCR (Optical Character Recognition) una habilida...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Research in Computing Science

دوره 120  شماره 

صفحات  -

تاریخ انتشار 2016